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текстонезалежно! 1дентифткаци диктора 


В статье рассмотрены особенности текстонезависимого подхода и основные этапы процедуры идентификации 
диктора. Предложена модификация типовой схемы идентификации при помощи предварительной сегментации 
речевого сигнала и структурирования базы моделей дикторов, а также объединения набора классификаторов 
акустических признаков в одно решающее правило обучением по алгоритму бустинга. Предложенные 
модификации повышают вероятность текстонезависимой идентификации и сокращают количество 
требуемых вычислений. 
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Введение 


Идентификация диктора представляет собой процедуру, в ходе которой не- 
обходимо производить классификацию звукового фрагмента по эталонным образам — 
акустическим моделям диктора, и на основании этого выносить решение о соответствии 
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заявленного голоса тому или иному диктору. Текстонезависимой является такая иден- 
тификация, которая выполняется по произвольному фрагменту звукозаписи речи без 
информации об ее текстовом содержимом. 

Идентификация личности по голосу на сегодняшний день востребована широким 
спектром многопользовательских аппаратно-программных решений от персональной 
техники до систем безопасности. Определение пользователя при помощи устной речи 
не требует особых биометрических детекторов и непосредственного физического контакта 
с ними, что открывает возможность удаленной идентификации посредством сети Интернет 
или мобильной связи. 

В текстонезависимых системах может использоваться любой фрагмент речи дик- 
тора, что делает их удобными с точки зрения пользователя, тогда как текстозависимые 
системы иде. Такие системы незаменимы при решении задач правоохранительной сферы: 
скрытая идентификация, криминалистическая идентификация, фоноучеты. Тем не менее, эта 
возможность усложняет реализацию текстонезависимых систем, понижает их надеж- 
ность и скорость распознавания. 

Метод классификации, примененный к определенным признакам в процедуре 
идентификации, называется классификатором. Каждый классификатор обладает некоторыми 
преимуществами и недостатками, по-разному реагирует на отличия в условиях обучения и 
распознавания, особенности голоса разных дикторов и т.д. Целесообразно использовать 
решения разных классификаторов, чтобы уменьшить ошибки распознавания. Учесть 
качество нескольких классификаторов позволяет бустинг — метод, основанный на ком- 
бинировании нескольких «слабых» классификаторов в один «сильный». Современные 
исследования показывают, что бустинг может успешно применяется к классификаторам 
графических образов [1], [2]. Данная работа заключается в адаптации алгоритма бустинга к 
задаче текстонезависимой идентификации диктора и оценке эффективности данного подхода. 

Особенности текстонезависимого подхода и разработанной системы иденти- 
фикации диктора. Текстонезависимый подход отличается использованием классифи- 
каторов, либо использующих всю совокупность признаков вместе, либо «привязываю- 
щихся» к определенным акустическим событиям (а не к последовательности призна- 
ков), таким образом самостоятельно компенсируя недостаток априорной информации о 
текстовом содержании аудиофрагмента. Разнообразие данных методов определяется 
возможностями компенсации межсессионной вариативности (т.е. отличий между запи- 
сями в разное время и на разном оборудовании), канальных искажений звукозаписы- 
вающего и передающего оборудования, шума. Применение нейросетей и их различных 
модификаций возможно для обеих задач, представляя собой альтернативу бустингу в 
плане универсальности [3]. 

Типовая процедура текстонезависимой идентификации диктора начинается с поиска 
в заданном звуком отрезке фрагментов, содержащих акустические события. Найденные 
фрагменты разбиваются на окна, частично перекрывающиеся, и по каждому окну вы- 
числяется вектор определенных акустических признаков. Далее в режиме обучения на 
основании полученных векторов признаков формируется образ — акустическая модель 
диктора и сохраняется в соответствующую базу данных. В режиме распознавания со- 
вокупность векторов признаков сопоставляется с имеющимися моделями дикторов и 
методом классификации выносится решение: идентификатор распознанного диктора, 
список ближайших дикторов-кандидатов или отказ распознавания в случае недостаточ- 
ного количества векторов признаков или низкой меры близости ко всем моделям 
дикторов [4]. 
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Разработанная система идентификации диктора имеет несколько принципиальных 
отличий от типовой схемы: 

— автоматическая сегментация на широкие фонетические классы (ШФК); 

— иерархическое структурирование базы моделей дикторов; 

— одновременное использование нескольких акустических признаков. 

Поскольку база данных системы содержит различные модели дикторов, основан- 
ные на нескольких акустических характеристиках, а также 2 метода классификации, 
структура базы моделей дикторов отличается для каждой комбинации признак-метод. 
Для проведения численных исследований этап принятия решения реализован в 3 моди- 
фикациях: на основе 2 методов классификации и композиции «слабых» классифи- 
каторов, полученной обучением методом бустинга. 

Как было отмечено, текстонезависимым методам для улучшения передачи харак- 
теристик диктора необходимо привязываться к определенным акустическим событиям. 
Модификацией метода гауссовых смесей и главной особенностью предложенной схемы 
идентификации является учет широких фонетических классов — множества, характери- 
зующего акустическое пространство голоса диктора. Именно ШФК в данной работе 
представляют те акустические события, на основании которых идет дальнейшая работа 
методов классификации. ШФК описывают определенные фонетические события (глас- 
ные, фрикативные и т.д.), по которым в отдельности формируются акустические моде- 
ли, в совокупности представляющие «комплексную» модель диктора. Существуют раз- 
личные классификации звуков согласно методам их извлечения и схожести восприятия 
органами слуха. В этой работе по результатам численных исследований был исполь- 
зован состав из четырех ШФК: глухие, звонкие, сонорные и гласные. Данный состав 
признан оптимальным для звуков речи русского языка по параметрам межклассового и внутри- 
классового разбросов векторов признаков в ходе проведенного численного исследования [5]. 

Еще одной особенностью предложенной схемы идентификации, использующей 
модифицированный нами метод на основе гауссовых смесей, является структуриро- 
вание моделей дикторов, занесенных в базу данных системы. Модели сохраняются с 
иерархическими связями между собой и фоновыми моделями групп дикторов, рас- 
положенных глубже (ниже по иерархии). Фоновая модель является аналогией модели 
диктора со следующими отличиями: 

— построена методом машин опорных векторов по схеме «один против всех» 
(решающее правило разделяет одну модель от всех остальных); 

— отдельными классами выступают низлежащие и сгруппированные по иерархии 
модели дикторов и их групповые модели. 

Роль групповых фоновых моделей заключается в возможности прохождения по 
дереву от корня к листьям. Возможным становится и проведение открытой иденти- 
фикации (когда дополнительно определяется наличие модели диктора в базе): по не- 
гативным результатам сравнения со всеми групповыми фоновыми моделями на текущем 
уровне иерархии можно утверждать об отсутствии распознаваемого диктора в базе 
моделей. Задача верификации не затрагивает данную иерархию, обращаясь к модели 
диктора по его идентификатору напрямую. 

Таким образом, структурирование позволяет избежать полного перебора базы мо- 
делей дикторов, существенно ускоряя процесс закрытой идентификации, позволяя вы- 
полнять открытую идентификацию и верификацию по этой же базе моделей дикторов. 
Предлагаемая структура идентификации диктора призвана снизить влияние канальных 
искажений и увеличить качество идентификации за счет применения различных дикторо- 
независимых признаков с целью разбиения произвольной речи на участки, принадлежа- 
щие различным ШФК, и создания для каждого диктора множества моделей для каждого 
фонетического элемента. 
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В качестве акустических признаков в системах распознавания диктора могут ис- 
пользоваться различные параметры, учитывающие процессы как речеобразования 
(характеристики распределения частоты основного тона, коэффициенты линейного 
предсказания, спектр Фурье), так и восприятия речи (вейвлет-спектр, мел-частотные 
кепстральные коэффициенты), и их динамические характеристики. Все извлекаемые из 
аудиосигнала показатели не лишены недостатков: робастные параметры обладают 
слабыми идентификационными качествами и, наоборот, параметры, характеризующие 
диктора с высокой точностью, достаточно сильно чувствительны к различным факто- 
рам (темп, громкость произнесения, физическое и эмоциональное состояние человека, 
вид и уровень помех в акустическом и электронном канале связи, искажение речевого 
сигнала приемниками звука и реверберацией помещения) [4]. 

В данной работе акустическими признаками диктора выступают Мел-частотные 
кепстральные коэффициенты (Ме! Недиепсу серза| соеЁйсет, МЕСС), зарекомендо- 
вавшие себя компактными и информативными признаками во множестве современных 
исследований как по распознаванию речи, так и диктора [6], [7]. Мел — психофизическая 
единица высоты звука, применяется главным образом в музыкальной акустике. Высота 
звука связана главным образом с частотой колебаний, но зависит также от уровня гром- 
кости звука и его тембра. Шкала Мел-частот аппроксимирует данные искажения субъектив- 
ного восприятия высоты звука, позволяя приблизить представление звуковой инфор- 
мации к человеческим величинам. Наиболее информативной частью спектра становится 
именно полоса речевой активности 0,5 — 4 кГц. 

МЕСС вычисляются аналогично кепстральным коэффициентам с той разницей, 
что на после дискретного преобразования Фурье выполняется отображение спектра по 
шкале Мел-частот. В результате первые 13 коэффициентов охватывают спектральную 
область до 8 кГц, чего достаточно для распознавания диктора. Для учета динамической 
составляющей вектор признаков дополняется производными от аналогичных коэффи- 
циентов, полученных по соседним окнам, таким образом общая длина вектора при- 
знаков равна 39. 

В качестве альтернативных акустических признаков использованы частота основ- 
ного тона вокализованного фрагмента и пики 2-4 формант. По сравнению с МЕСС эти 
признаки имеют менышую вероятность верного распознавания при использовании одного 
и того же классификатора (исследование проводилось с помощью гауссовых смесей). 
Частота основного тона определяется при помощи автокорреляционной функции с 
постфильтрацией значений. Пики формант находятся по сглаженному спектру на основе 
коэффициентов линейного предсказания [5]. 

Первоначально в рамках данной работы для классификации использовались только 
гауссовы смеси. Этот классификатор представляет собой аналогию скрытой марковской 
модели с одним состоянием. Затем для построения групповых моделей дикторов был 
использован метод машин опорных векторов по схеме «один против всех». Отличие 
данных классификаторов принципиально: гауссовы смеси предназначены максимально 
точно описать одну конкретную выборку признаков каждой модели и, следовательно, 
решение о классификации будет принято на основании максимального соответствия 
тестовой выборки одной из моделей. А метод машин опорных векторов позволяет 
определить в многомерном пространстве признаков расположение гиперплоскости, 
являющейся равноудаленной от крайних (опорных) векторов двух противоположных 
классов, формируя при линейной неразделимости признаков искривленное простран- 
ство, добиваясь их разделимости. В силу принципиальных различий было принято 
решение использовать оба метода для построения множества «слабых» классифика- 
торов в алгоритме бустинга. 


194 «Искусственный интеллект» 2014 №4 


Исследование эффективности бустинга в задаче... вк 


Модели гауссовых смесей представляют классы в пространстве признаков в виде 
многомерного вероятностного распределения. Класс описывается как взвешенная сумма М 
нормальных распределений: 


Ра) >. тр, (*) р -1 (1) 


где х — /--мерный вектор признаков; 

и,  — веса компонентов модели; 

р,  - многомерные функции плотности распределения составляющих. 

Таким образом, модель описывается векторами математического ожидания, кова- 
риационными матрицами и весами смесей для каждого компонента модели [8]. 

Способом оценки параметров модели является метод максимизации правдоподобия: 


М 
р(хеЕЛ)=>, м, р(х) 
1—0 
ь (2) 


где ^. — модель, относительно которой вычисляется вероятность соответствия. 

Метод машин опорных векторов определяет принадлежность объектов к классам с 
помощью границ областей. 

При классификации только по двум категориям (подход может быть расширен на 
любое конечное количество категорий), каждый объект классификации является век- 
тором в Л-мерном пространстве. 

Метод машин опорных векторов базируется на таком постулате: наилучшая раз- 
деляющая прямая — это та, которая максимально далеко отстоит от ближайших до нее 
точек обоих классов. То есть задача метода машин опорных векторов состоит в том, 
чтобы найти такие вектор у’ и число уд, чтобы ширина разделяющей полосы была 
максимальна. Поскольку чем шире полоса, тем увереннее можно классифицировать 
документы, соответственно, в методе машин опорных векторов считается, что самая 
широкая полоса является наилучшей. Границами полосы являются две параллельные 
гиперплоскости с направляющим вектором у. Точки, ближайшие к разделяющей гипер- 
плоскости, расположены точно на границах полосы, при этом сама разделяющая гипер- 
плоскость проходит ровно посередине полосы. Опорным вектором называется объект 
обучающей выборки х; ‚ находящийся на границе разделяющей полосы. 

Для улучшения метода применяется идея расширенного пространства, которая 
заключается в переходе от исходного пространства признаковых описаний объектов Хк 
новому пространству Н с помощью некоторого преобразования у: Х -> Н. Если 
пространство Н имеет достаточно высокую размерность, то вполне вероятно, что в нём 
выборка окажется линейно разделимой. При выборе признаковыми описаниями объектов 
векторов \у(х; ), а не векторов х; ,‚ построение машин опорных векторов проводится точно так 
же. Отличие состоит в том, что скалярное произведение <х, х” в пространстве Х 
заменяется скалярным произведением <\у(х), \у(х’)> в пространстве Н. Спрямляющее 
пространство должно быть наделено скалярным произведением, следовательно, в общем 
случае применимо любое гильбертово пространство [9]. В данной работе в качестве 
ядра использована радиальная базисная функция: 


Н(х,х')=ехр(—с|х-—х') 
’ (3) 


где с — настраиваемый параметр. 
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В блоке принятия решений реализован наиболее известный алгоритм бустинга 
АдаВоо$. Он строит сильный классификатор машинного обучения по набору слабых 
алгоритмов машинного обучения путем многократного прохождения по обучающей 
выборке (х/, у/),..., (хи, уп) и увеличения веса примеров, на которых слабые алгоритмы 
Ни дают большую ошибку обучения е„. Начальная функция распределения весовых 
коэффициентов является равномерной. Каждая итерация начинается с того, что 
находится лучший на текущем распределении ДП), , слабый классификатор: 


й„(х)=агетт(е„), 
ы 
р р), й, ху, 
^ 4) 


Затем выполняется нахождение коэффициента а»„ и соответствующей функции /м 
голосования 7-го классификатора: 


1-е 


т 


$ (5) 
Л=(х)=ай„(х,) 


1 
=—.| 
а,= 5 О 


Итерация завершается пересчетом распределения весов: 


Р„(Йехр(—у,/„(х,)) 


Р„.. (= 


11 7 
где 7, — нормализующий коэффициент. ы 
Таким образом, сильный классификатор представляется в виде: 
м 
Е(х)=яв"| >. у „(х) 
- (8) 


Численные исследования эффективности применения бустинга. На основе 
имеющихся разработок было построено множество «слабых» классификаторов. В него 
включены различные комбинации признак-классификатор на основе одного и всех ши- 
роких фонетических классов. Проведены циклы бустинга множества классификаторов 
на обучающих выборках с разным количеством распознаваемых классов (дикторов) от 
2 до 50. Звукозаписи дикторов были взяты из общедоступной базы УохЕогее [11]. Из 
более чем 500 дикторов была получена случайная простая вероятностная выборка 
звукозаписей 50 дикторов. Звукозаписи представлены в виде \У’ау-файлов с глубиной 
квантования 16 бит и частотой дискретизации 16 кГц. Все дикторы записаны дина- 
мическим микрофоном в спокойном эмоциональном состоянии, 42 диктора —-мужчины, 
8 — женщины, возраст дикторов не занесен в базу, на слух все дикторы средних лет без 
присутствия детских или престарелых голосов. 

Обучение проводилось на фрагментах речи дикторов продолжительностью от 8 до 
50 секунд. Во фрагментах каждого диктора было зафиксировано наличие акустических 
признаков, относящихся ко всем ШФК. 
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Результаты проведения бустинга следует разделить на прогрессивную оценку при 
изменении количества моделей дикторов для обучения и на относительную оценку 
влияния классификаторов. Также приведен сравнительный анализ эффективности иден- 
тификации диктора «слабыми» классификаторами и композицией классификаторов. 
Распознавание проводилось по фрагментам дикторов той же сессии звукозаписи про- 
должительностью 5 - 7 секунд. 

Прогрессивная оценка позволяет отобразить влияние размера обучающей выборки на 
распределение весовых коэффициентов 5. (р < 0,05). На рис. 1 представлены графики изме- 


нения коэффициентов при 2 < М < 50 для различных ШФК, используемых в данной работе. 
0,05 - 
И 0,04 - 
0,03 - 
0,02 
0,01 - 


Рисунок 1 — Зависимость весовых коэффициентов (1) от количества дикторов (п) «слабых» 
классификаторов с использованием различных ШФК (а — глухие, б — звонкие, в — сонорные, 
г_ гласные), применяя мел-частотные кепстралные коэффициенты в качестве акустических 
признаков, а также гауссовы смеси (пунктирная линия) и машины опорных векторов 
(сплошная линия) в качестве методов классификации 


Аналогичная зависимость для классификаторов с использованием в качестве акусти- 
ческих признаков частот основного тона и формантных пиков представлена на рис. 2. 

Зависимость весовых коэффициентов от размера обучающей выборки (количества 
моделей диктора) 2 < М < 50 позволяет установить: 

— значительное уменьшение влияния классификаторов, основанных на ЧОТ, при 
увеличении количества моделей; 
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— стабильно высокое влияние классификаторов методом опорных векторов с ком- 
плексным признаками ШФК; 

— из классификаторов с признаками по одному из ШФК наибольший вклад пока- 
зывают вокализованные при малом количестве дикторов и сонорные с шипящими -— при 
большем количестве дикторов. 


к 1 


0,12 


Рисунок 2 — Зависимость весовых коэффициентов (1) от количества дикторов (и) 
«слабых» классификаторов с использованием в качестве акустических признаков частот 
основного тона (1, 1”) и формантных пиков (2, 2”), применяя гауссовы смеси (1, 2) 

и машины опорных векторов (1’, 2”) в качестве методов классификации 


Относительная оценка позволяет увидеть вклад отдельных «слабых» классифика- 
торов в сравнении друг с другом (рис. 3). В качестве показателя тут применен усреднен- 
ный весовой коэффициент бустинга после обучения на выборках от 2 до 50 дикторов, 
по 2 отрезкам произношений каждого диктора. 
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м у 22 > 
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Ш Машины опорных векторов (1) @ Модели гзуссовых смасей (2) 


где МЕСС - мел-частотные кепстральные коэффициенты; 
ЧОТ - частота основного тона; ФИ — - формантные пики; 
К - кол-во классификаторов; 4 — вектор признаков, дополненный производными 
Рисунок 3 — Сравнение весовых коэффициентов (|1) «слабых» классификаторов, 
полученных различными методами, в решающем правиле, построенном алгоритмом бустинга 
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Исходя из графика можно сделать следующие выводы: 

— наибольший вклад в решающее правило вносят классификаторы, основанные на 
совокупности отдельных ШФК; 

— вклад методов значительно не отличается при использовании одинаковых характе- 
ристик, исключения составляют лишь характеристики, помеченные *, где отличия между 
классификаторами на основе различных методов достоверны (р < 0,05). 

Сравнение эффективности «слабых» классификаторов с решающим правилом, по- 
строенным алгоритмом бустинга на множестве тех же классификаторов показало пре- 
восходство бустинга по доле верно идентифицированных дикторов в среднем на 2,4 + 1,1% 
(р< 0,05) при 10 <№М< 50. 


Выводы 


Предложена схема текстонезависимой идентификации диктора, включающая предва- 
рительную сегментацию по широким фонетическим классам (ШФК) и иерархическое 
структурирование базы моделей дикторов. Показано, что разбиение речи на участки, 
принадлежащие различным ШФИК, и создание для каждого диктора множества моделей 
фонетических элементов, увеличивает качество идентификации на 2,5 + 0,8% (р < 0,05) 
по сравнению с моделями без предварительной сегментации. 

1. Иерархическое структурирование позволяет избежать полного перебора базы 
моделей дикторов, ускоряя процесс закрытой идентификации в 4-5 раз в зависимости от 
количества дикторов (при 20 < М < 50). Выигрыш в скорости возрастает с увеличением 
количества моделей дикторов в базе. 

2. Вклад рассмотренных методов классификации значительно не отличается при 
использовании одинаковых характеристик, исключения составляют лишь характеристи- 
ки МЕСС и формантные пики с производными. 

3. Применение бустинга позволило улучшить вероятность верной идентификации. 

В ходе численных исследований решающее правило на основе бустинга текстонезави- 
симо идентифицировало до 100 + 0,2% (р < 0,05) дикторов при их количестве Л|Е10 и до 
97,2 + 0,9% (р < 0,05) при №=50, что превосходит результат, полученный с применением 
рассмотренных «слабых» классификаторов, в среднем на 2.4 + 1,1% (р < 0,05) при 19 < М< 50. 
С возрастанием количества моделей дикторов преимущество комбинации классифика- 
торов над «слабыми» классификаторами становится значительным. 

Развитием данной работы для построения робастной текстонезависимой системы 
идентификации диктора могут стать следующие направления исследований: 

— исследование эффективности проведения процедуры верификации по создан- 
ным моделям; 

— исследование характеристик канальных искажений с целью построения их пред- 
ставительной базы данных для компенсации динамических помех в речевом сигнале; 

— исследование возможности оптимизации скорости идентификации с помощью 
оценки весовых коэффициентов, полученных при обучении алгоритмом бустинга. 


Список литературы 


1. Ивао Н. ВоозИп$; Птазе Кеблеут» Кезий ууйр СР$ бепзог шгтайоп / ГВао, Нопе\е! апа \!ап?, 7Веп 
апа Гла, Разрше ап4 Сао, ЗВап ап М оп?, /Битепе // Зепзог Гебегз. — Атейсап Зс1епийс РиБИзПегз, 
2014. —У. 12, № 2.-Р. 213-217. 

2. Зазсра Е.А. Миепите. ОГК Воо3 — Ап а|гогИйт Юг Боо5Ип? аеюгтаЫе птазе гез1$гайоп: АррИсайоп 
ю п СТ шна-заБ ес гезл5гайоп / Зазсва Е.А. Мчепите, Вгат уап ОшпеКеп, Мах А. Утегоеуег, 
озеп Р.\. Рип // Ме!са| Ппазе Апа[уз15. — Е]е\ег, 2014. — У. 18, № 3. - Р. 449-459. 


«Штучний 1нтелект» 2014 №4 199 


вк Клименко Н.С., Герасимов И.Г. 


3. Первушин Е.А. Обзор основных методов распознавания дикторов / Е.А. Первушин // Математические 
структуры и моделирование. — 2011. — № 24. — С. 41-54. 

4. Сорокин В.Н. Верификация диктора по спектрально-временным параметрам речевого сигнала / В.Н. Сорокин, 
А.И. Цыплихин // Информационные процессы. —Т. 10, №2.—С. 87-104. 

5. Клименко Н.С. Разработка структуры текстонезависимой системы идентифи-кации диктора // Искусственный 
интеллект. — 2012. — №4.—С. 161-171. 

6. Маг@пех, 7. ЗреаКег гесогпоп изш? Ме! Недиепсу Сера] СоеЁ сет (МЕСС) апа Уесюг диапитаноп (УО) 
феснтаиез / 7. Майшей, Н. Реге7, Е. ЕзсатШа, М.М. Зитак // Еесёса! Сотииашсаноп$ ап@ Сотрщегз 
(СОМЕГЕСОМР) 22п4 Пщегпайопа! Сопегепсе оп 27-29 ЕеБ. 2012. —ТЕЕЕ, 2012.-Р. 248-251. 

7. АП АН КраШ А.А. ЕЁйсепЕ зреаКег 1Ч4епиЯсаНоп Нот зреесВ тапзпе4 оуег Ылеюо Базе зузет / 
АП АП КраШ А.А., Моза Заа4 Е.5., Е!-Маб М.А., АБа Е!-Запие Е.Е. // Сотриег Епотеегте & 
Зузет$ (1ССЕ5), 2013 8 ПщегпаНопа| СопЁегепсе оп 26-28 Моу. 2013. —ТЕЕЕ, 2013. -Р. 190-193. 

8 Садыхов Р.Х. Модели гауссовых смесей для верификации диктора по произвольной речи / Р.Х. 
Садыхов, В.В. Ракуш // Доклады БГУИР. — 2003. — №4. — С. 95-103. 

9. ВаШей Р. Сепега|тайоп регогтапсе оЁ зиррой уесюг тасНтез ап4 оег рацегт сЛазз1Негз / Р. ВагИей, 
7. ЗВаме-Тау[ог // Адуапсез ш Кегпе! Меод$. МПТ Ргезз, 1998. 13 р. 

10. 7ви, Г. Ма-с]аз$ адафооз1 / ИЛ, Г., Гоц, Н., Воззеф 5., Наз@е, Т. // МаН$Ис$ апа $ ПиегЁасе. — 2009. — 
Уо1. 2. -Р. 349-360. 

11. Электронный ресурс: ВИр://уохЮгее.оге/ги/4о\утоа4$. 


ВеЕегепсез$ 


1. Ивао Н. Воозйп$ Птазе Вееуте Кезий ув СР$ Зепзог шогтаНоп / Хвао, Ноп?\е! апа \!ап, Гвеп 
апа Гла, Рагрш? ап@ Сао, ЗВап ап М оп?, ХВйтепе // Зепзог Гейегз. — Атейсап Зс1епийЯс Раб зВегз, 
2014. —У. 12, №2.-Р. 213-217. 

2. Зазсва Е.А. Мчепяте. ОГВ Воо3( — Ап а|2огт Юг Боозйп? аеюгтаЫе птазе гез15гайоп: АррИсайоп 
0 п СТ шна-заБ]ес гезл5гайоп / Зазсва Е.А. Миепит?, Вгат уап ОшпеКеп, Мах А. Утегоеуег, 
Тозеп Р.\. Рип // Ме!са| Ппазе Апа1уз15. — Е]земег, 2014. — У. 18, № 3. -Р. 449-459. 

3. Регуязш Е.А. ОБтог озпоупуй тею4оу газрогпауатуа ЧЙкюгоу / Е.А. Регуизш // МаетайсвезНе 
эгаКигу [Г подейгоуаше. — 2011. — № 24. -Р. 41-54. 

4. Зогокт У.М. УемКауа Ага ро зреКгапо-угетеппут рагатегат геснеуозо $12па1а / У.М. ЗогоКт, 
А.Т. ТзрИи // шогтаоппуе ргосеззу. — У. 10, № 2. -Р. 87-104. 

5. КБтепко М.5$. КахгабоКа згаКеагу 1еКзюпетах1$Итоу 515ету 1ЧепЯКаи ЧИкога // 15Кизбуещу пиееКЕ. 

2012. — №4. — С. 161-171. 

6. Магипех, 7. ЗреаКег гесогпоп изт? Ме! Недиепсу Сера] СоеЁ Нет (МЕСС) апа Уесюг диапитайоп (УО) 
фесртаиез / 7. Майшей, Н. Реге7, Е. ЕзсатШа, М.М. Зитак // Еесвса! Сотииашсаноп$ ап@ Сотрщегз 
(СОМЕГЕСОМР) 22п4 Пщегпайопа! Сопегепсе оп 27-29 Ее. 2012. —ТЕЕЕ, 2012.-Р. 248-251. 

7. АП АН КраШ А.А. ЕЁйсепЕ зреаКег 1Ч4епиЯсаНоп Нот зреесВ тапзие4 оуег Ылеюо Базе зузет / 
АП АП КВаШ А.А., Моза Заа4 Е.5., Е|-Маб М.А., АБа Е!-Запие Е.Е. // Сотриег Епотеегте & 
Зузет$ (1ССЕ5), 2013 8 ПщегпаНопа| СопЁегепсе оп 26-28 Моу. 2013. —ТЕЕЕ, 2013. -Р. 190-193. 

8. бааупоу В.Н. Модей залззоуур зтезеу Шуа уе Кай ЧИкога ро рго17уошоу гес№ / В.Н. Задупоу, У.У. 
ВаКизВ // РоНаду ВСОТК. - 2003. — №4. - Р. 95-103. 

9. ВаШей Р. Сепега|таНоп регогтапсе оЁ зирром уесюг тасНтез ап оег рацегт сЛазз1Негз / Р. ВагИей, 
7. ЗВаме-Тау|ог // Адуапсез ш Кегпе! Мефод$. МПТ Ргезз, 1998. 13 р. 

10. ГВ, Г. Мш@-с1аз$ адабоо$( / Ил, Т., Гом, Н., Коззеф, 5., Наз@е, Т. // Май$Ис$ апа Пз ПиетЁ асе. — 2009. — 
Уо1. 2. -Р. 349-360. 

11. Еесвошс гезопгсе: ВИр://уохЮюгее.оге/га/до\уТоа4$. 


КЕЖОМЕ 
М.5. КЮутепкКо, 1.С. Сегаятоу 


Кезеагсй оГВоо5йие Етслепсу Гог Тех1-[таерепдеи! 5реакег 
[аепийсаноп 5уЯет 


ш Фе агасе, Фе сБагасет$Ис$ ап ргоетз се Бу 4еуе]орегз оЁ 1ех-тдерепдет 
зреаКег 14епиЯсаноп зузет аге апа[у7е4. А!зо Ше фурса! зсВете оЁ 1$ 1азК 15 БлеЙу 
сопу4егед. 


200 «Искусственный интеллект» 2014 №4 


Исследование эффективности бустинга в задаче... вк 


Вазе4 оп Ше апа1уз1$, ргорозе4 зёгасйге оЁ1ех{ ш4дерепдеп: зреаКег 14епиНсаНоп зузет 
ул Фе а4ЧШоп оЁа Шегагсыса| дабаБазе оЁ зреаКег’$ ппо4е!5 ап4 амютанс рге-зеотетщайоп 
ОР Фе зреесН $1юпа| ш®ю зесйопз сощашше рбопетез Нот @Шегеп ул4е рКопейс с1аз$ез 
(М\ЕК). 

Зиооее шегагсШса| то4е| дайафазе ул тедисе ве питфег оЁ сотрайзопз$ Бебмееп фе 
то4е| ап затре. ТБегебу й уз етсапЙу зреед ир Фе 14епйЙсайоп ргосез$. Озше 
с1азШсаНоп ог зреаКег-ш4ереп4епй зеотепз ул пеиаПте е Ч1Еегепсе Бебмееп башше апа 
тесоэттае сощех{ ап4 аПо\\у Ю сгезе а её оЁ зреаКег плоде] оМатед Бу Чегет \РС$. ТЫ$ 
сап яетисапй у паргоуе Ше еЁйс1епсу оЁ14епйЯсаНоп. 

ОСаиз1ап пихте тоде[$ аге изе4 юг под! с1азШсайоп ап4 зиррог уесюг тастез аге 
и5е4 Юг отоир БасКотоипа то4е!$ ш бе Шегагсву. Еоптапй реаК$, Недиаепсу оЁ Фе рисН апа 
ше!-Недиепсу серза! сое слеп аге изе4 аз ап асопзИс ГЕеабшгез оЁ рБопетез$. Еасв 
сот шпайоп оЁ те#о4-Еафте огте ш "\уеаК" с1азз1Шег. ТБе зе{ ог оМашей с1азз1егз 
у’еге ташеа Бу БоозИпе а[2огИбт. [ гези $ ш а зше]е сотЫшеа дес1з1оп ге. 

А питепйса! за4у оЁ фе еЁсасу оЁ БоозНие уЛисВ 1$ аррПе@ № Фе зеё оЁ "\ухеаК" 
с1аззШегз асоизис ре!огтед. СотЫпе4 4еслуюп пе Бу ап ауегазе оЁ 2.4% ШеНег фап Фе 
тези Е оМате изше "ууеаК" с1азШеге. 


Статья поступила в редакцию (5.06.2014. 
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